ابهام زدایی واژگانی صفات مبهم در ترجمه ماشینی: بررسی پیکره بنیاد
نویسندگان
چکیده
موضوع ابهام در معانی واژه ها و ساختار ها و چگونگی برطرف کردن آن به ویژه به هنگام ترجمه ماشینی ذهن بسیاری از محققان را در این حوزه به خود مشغول داشته و برای آن راهکار های گوناگونی ارائه شده است. در این مقاله بر آنیم تا به ابهام موجود در واژه ها بپردازیم.صفات و نامهای مبهم با تعدد معانی خود دشواریهایی را در ترجمه ماشینی بوجود می آورند . در برنامه های خودکار که اراده انسانی در انتخاب معادل دخالتی ندارد این موضوع عیان تر است. ماشین نمی تواند بر اساس بافت به صورت خودکار بهترین معادل را انتخاب کند حال آنکه به کمک زبانشناسی رایانه ای و بکار گیری پیکره ها این امر ممکن است. در پژوهش حاضر به منظور اثبات این توانایی از میان دو مقوله اسم و صفت ، صفات را برای بررسی انتخاب کردیم. برای این کار کلیه ی صفات انگلیسی موجود در یک فرهنگ متوسط ( فرهنگ هزاره) را به همراه معانی متعدد آنها استخراج کرده و ضبط کردیم، آنگاه این صفات را در یک کشف اللغات موازی انگلیسی به فارسی قرار دادیم و جملاتی را که این صفات در آنها به کار رفته بودند ضبط کرده و این صفات را به همراه بافت و معنا استخراج کردیم و فهرستی به صورت یک کشف اللغات تهیه کردیم. برنامه ای برای این کشف اللغات نوشته شد به گونه ای که از میان معانی موجود بالاترین بسامد معنایی به همراه با هم آیی و بدون آن به عنوان معادل به هنگام ترجمه انتخاب شود. معادل های انتخاب شده رامترجمین انسانی نیز آزمودند و نتایج نشان دادند که در بیش از 50 درصد موارد معادل های انتخاب شده از سوی مترجمین با آنچه که برنامه ابهام زدایی انتخاب کرده بود یا یکسان و یا بسیار نزدیک بودند. نتایج حاصل از این پژوهش در امر ترجمه ماشینی، بازیابی اطلاعات دوزبانه، ایجاد شبکه های واژگانی و آموزش زبان فارسی سودمند خواهد بود.
منابع مشابه
استخراج پیکره موازی از اسناد قابل مقایسه برای بهبود کیفیت ترجمه در سیستم های ترجمه ماشینی
امروزه با گسترش وسائل ارتباط عمومی و به خصوص شبکه جهانی اینترنت، نیاز به عملیات ترجمه خودکار به صورت چشم گیری افزایش یافته است. یکی از مطرح ترین روش های ترجمه ماشینی، روش آماری است. پارامترهای سیستم ترجمه ماشینی آماری با استفاده از مجموعه بزرگی از دادگان آموزشی (پیکره موازی دو زبانه) تخمین زده می شود؛ اما در برخی زبان ها هنوز مسئله نیاز پایه ای سیستم ترجمه ماشینی آماری یعنی پیکره های متنی بزرگ ...
متن کاملابهام در ماشین ترجمه
هدف از انجام این تحقیق، بررسی گونههای مهم ابهام واژگانی و ساختاری و نیز مشکلاتی است که اینگونه ابهامها را در امر ترجمه ماشینی ایجاد مینمایند. برای انجام این کار پنج نوع مهم ابهام واژگانی با عناوین ابهامهای مقولهای، واژههای همآوا ـ همنویسه، واژههای همنویسه، چند معنایی و ابهام انتقالی، با ارائه مثالهایی از فارسی و انگلیسی مورد بررسی قرار گرفت. سپس ابهام ساختاری بررسی شد و دو نوع ...
متن کاملنگرشی بر ترجمه ماشینی
از دیر باز بشر همیشه در آرزوی اختراع دستگاهی بوده است که بتواند متون را از زبان مبداء به زبان مقصد با سرعت و دقت فراوان ترجمه کند. تلاش برای رسیدن به این آرزو بیش از پنج دهه است که آغاز شده است و محققان دسا اوردهایی در زمینه طراحی سیستم ها و ساخت ماشین های مترجم بدست آورده اند ولی نام ماشینهای مترجم همواره مفهوم منفی را در ذهن افراد تداعی می کند و بیشتر مترجمان و محققان نظر منفی درباره ماشینهای...
متن کاملنقش نشانه های نوایی در ابهام زدایی از عبارات مبهم فارسی
نقش نشانه های نوایی در ابهام زدایی از عبارات مبهم فارسی در دو آزمایش تولیدی و شنیداری جداگانه مورد بررسی قرار گرفت. دو نوع عبارت مبهم برای این منظور انتخاب شدند. نوع اول، زنجیره های آوایی سه هجایی بودند که بسته به محل حضور مرز واژگانی، به دو صورت یک واژه ای و دو واژه ای خوانده می شدند. نوع دوم گروه های اسمی دارای ابهام ساختاری شامل توالی یک اسم و دو صفت بودند که بسته به محل حضور مرز گروه نحوی م...
متن کاملابهام شناسی در ترجمه قرآن
ابهام شناسی از جمله مباحث مهم زبان شناسی ترجمه است که از گذشته تا کنون، ابعادی از آن به تناسب و با عناوین مختلف در علوم گوناگون مورد توجه قرار گرفته و دانشمندان کم و بیش بدان پرداخته اند. اما در این تحقیقات، بررسی تطبیقی و توجه همزمان به مبدأ و مقصد و به ویژه محور قرار دادن قرآن و تنظیم مباحث به فراخور آن که در ترجمه قرآن نقشی مهم و درخور توجه دارد، جایگاه مناسبی نیافته است. البته تحقیقات یاد ...
متن کاملرفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA
Word sense disambiguation is the task of identifying the correct sense for the word in a given context among a finite set of possible sense. In this paper a model for farsi word sense disambiguation is presented. The model use two group of features: first, all word and stop words around target word and topic models as second features. We extract topics from a farsi corpus with Latent Dirichlet ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
پژوهشنامه پردازش و مدیریت اطلاعاتجلد ۳۰، شماره ۳، صفحات ۷۱۹-۷۳۵
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023